In the Summary Table menu, numerical variables are
aggregated into statistical tables, and categorical
variables are aggregated into frequency tables and
contingency tables. And it is visualized to easily
understand the distribution of variables.
Create statistical tables of numeric variables and visualize their distributions.
The summary table function is accessed through the menu system of Descriptive Statistics > Summary Table > Statistical Table of Numerical Variables.
All and Custom with the
radio button.Numerical Variables(Choose one or more):
will appear.User choose is specified in
Target variable selection type:.missing, mean,
standard deviation, skeweness,
kurtosis, observation, SEM,
IQR.mean, standard deviation,
skeweness, kurtosis are selected by
default.min, Q1, median,
Q3, max, 1%th, 5%th,
10%th, 20%th, 30%th,
40%th, 60%th, 70%th,
80%th, 90%th, 95%th,
99%th에서 선택합니다.min, Q1, median,
Q3, max are selected by default.Here, outputting a statistical table from the
Statistical Table of Numerical Variables is assuming that
diamonds data is selected in the Dataset: list
box.
As the default setting of Descriptive Statistics > Summary Table
> Statistical Table of Numerical Variables, if you click the
Execute button, the statistical table is
output in the right result area.
These default settings are:
mean, standard deviation,
skeweness, kurtosismin, Q1, median,
Q3, maxStatistical Table of Numeric Variables
Instead of all numeric variables, the user can select a numeric
variable. This example selects the variables caret,
depth, table and price.
The settings for the statistical table are now defined as follows:
caret, depth, table,
pricemean, standard deviation,
skeweness, kurtosismin, Q1, median,
Q3, maxWhen executed under the above conditions, the following statistical table is output.
Statistical table with selected variables
If you check the Calculate by category check box, you
can calculate the statistical table of numeric variables for each level
of the selected categorical variable.
If you check the Calculate by category check box, a
widget called Categorical variables: is displayed. Here you
select the categorical variable cut.
Select a list of categorical variables
The settings for the statistical table are now defined as:
caret, depth, table,
pricemean, standard deviation,
skeweness, kurtosismin, Q1, median,
Q3, maxcutWhen executed under the above conditions, the following statistical table is output.
Statistical table of numeric variables by categorical varables
Since the statistics table consists of several statistics, it is not easy to understand the distribution of the corresponding numeric variable. However, with visualization, it becomes easier to understand the distribution of numerical variables.
If you check the Plot chart check box, a
density plot is output after the statistical table to
understand the distribution of numerical variables.
The following is the result when the Plot chart check
box is checked. Density plots are visualized for each selected numeric
variable along with a statistical table.
Statistical tables and plots
If you check the Plot chart check box and select a
categorical variable, a density plot of the numeric variable is created,
separated by level of the selected categorical variable.
Statistical table with density plots of numeric variables by level of categorical variables
범주형 변수의 돗수분포표(frequency table)를 작성하고 분포를 시각화합니다.
통계표 기능은 기술통계 > 집계표 > 범주형 변수 돗수분포표의 메뉴 체계로 접근합니다.
전체와 사용자 선택에서
하나를 선택합니다.범주형 변수 목록(하나이상 선택): 리스트 박스가
나타납니다.대상변수 선택 방법:에서 사용자 선택을
지정했을 때만 나타납니다.막대그래프(bar plot)을 함께 출력할지의 여부를
선택합니다.범주형 변수 돗수분포표에서 돗수분포표를 출력하는 방법은
데이터셋: 리스트박스에서 diamonds 데이터를
선택을 전제로 소개합니다.
기술통계 > 집계표 > 범주형 변수 돗수분포표의 기본 설정으로
실행 버튼을 클릭하면 오른쪽 결과 영역에 범주형
변수의 돗수분포표가 출력됩니다.
이 기본 설정은 다음과 같습니다.
범주형 변수의 돗수분포표
두 범주형 변수의 분할표(contingency table)를 작성하고 분포를 시각화합니다.
통계표 기능은 기술통계 > 집계표 > 범주형 변수 분할표의 메뉴 체계로 접근합니다.
주변 합 종류: 리스트 박스가
출력됩니다.주변 합, 행 백분율,
열 백분율, 전체 백분율에서 하나를
선택합니다.주변 합입니다.모자이크플롯(mosaic plot)을 함께 출력할지의 여부를
선택합니다.기술통계 > 집계표 > 범주형 변수 분할표의 기본 설정으로
실행 버튼을 클릭하면 오른쪽 결과 영역에 두 범주형
변수의 분할표가 출력됩니다.
이 기본 설정은 다음과 같습니다.
cutcolor두 범주형 변수의 분할표
분할표에 개별 행/열의 집계를 위한 주변 합을 추가할 수 있습니다.
cutcolor주변 합상기 조건으로 실행하면 다음과 같은 분할표가 출력됩니다.
주변합을 포함한 두 범주형 변수 분할표
시각화 여부 체크 박스를 체크하면, 두 범주형 변수의
분포를 파악할 수 있는 모자이크플롯(mosaic plot)을 함께
출력할 수 있습니다.
다음은 시각화 여부 체크 박스를 체크한 경우의 결과입니다.
분할표로 출력된 두 범주형 변수의 분포를 파악할 수 있는 플롯이
출력됩니다.
시각화 포함 분할표